##Rotación de cargo
En una organización, se busca comprender y prever los factores que influyen en la rotación de empleados entre distintos cargos. La empresa ha recopilado datos históricos sobre el empleo de sus trabajadores, incluyendo variables como la antigüedad en el cargo actual, el nivel de satisfacción laboral, el salario actual, edad y otros factores relevantes. La gerencia planea desarrollar un modelo de regresión logística que permita estimar la probabilidad de que un empleado cambie de cargo en el próximo período y determinar cuales factores indicen en mayor proporción a estos cambios.
Con esta información, la empresa podrá tomar medidas proactivas para retener a su talento clave, identificar áreas de mejora en la gestión de recursos humanos y fomentar un ambiente laboral más estable y tranquilo. La predicción de la probabilidad de rotación de empleados ayudará a la empresa a tomar decisiones estratégicas informadas y a mantener un equipo de trabajo comprometido y satisfecho en sus roles actuales.
A continuación se describen los pasos que la gerencia ha propuesto para el análisis:Seleccione 3 variables categóricas (distintas de rotación) y 3 variables cuantitativas, que se consideren estén relacionadas con la rotación.
## Rotación Edad Viaje de Negocios Departamento
## Length:1470 Min. :18.00 Length:1470 Length:1470
## Class :character 1st Qu.:30.00 Class :character Class :character
## Mode :character Median :36.00 Mode :character Mode :character
## Mean :36.92
## 3rd Qu.:43.00
## Max. :60.00
## Distancia_Casa Educación Campo_Educación Satisfacción_Ambiental
## Min. : 1.000 Min. :1.000 Length:1470 Min. :1.000
## 1st Qu.: 2.000 1st Qu.:2.000 Class :character 1st Qu.:2.000
## Median : 7.000 Median :3.000 Mode :character Median :3.000
## Mean : 9.193 Mean :2.913 Mean :2.722
## 3rd Qu.:14.000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :29.000 Max. :5.000 Max. :4.000
## Genero Cargo Satisfación_Laboral Estado_Civil
## Length:1470 Length:1470 Min. :1.000 Length:1470
## Class :character Class :character 1st Qu.:2.000 Class :character
## Mode :character Mode :character Median :3.000 Mode :character
## Mean :2.729
## 3rd Qu.:4.000
## Max. :4.000
## Ingreso_Mensual Trabajos_Anteriores Horas_Extra
## Min. : 1009 Min. :0.000 Length:1470
## 1st Qu.: 2911 1st Qu.:1.000 Class :character
## Median : 4919 Median :2.000 Mode :character
## Mean : 6503 Mean :2.693
## 3rd Qu.: 8379 3rd Qu.:4.000
## Max. :19999 Max. :9.000
## Porcentaje_aumento_salarial Rendimiento_Laboral Años_Experiencia
## Min. :11.00 Min. :3.000 Min. : 0.00
## 1st Qu.:12.00 1st Qu.:3.000 1st Qu.: 6.00
## Median :14.00 Median :3.000 Median :10.00
## Mean :15.21 Mean :3.154 Mean :11.28
## 3rd Qu.:18.00 3rd Qu.:3.000 3rd Qu.:15.00
## Max. :25.00 Max. :4.000 Max. :40.00
## Capacitaciones Equilibrio_Trabajo_Vida Antigüedad Antigüedad_Cargo
## Min. :0.000 Min. :1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.:2.000 1st Qu.:2.000 1st Qu.: 3.000 1st Qu.: 2.000
## Median :3.000 Median :3.000 Median : 5.000 Median : 3.000
## Mean :2.799 Mean :2.761 Mean : 7.008 Mean : 4.229
## 3rd Qu.:3.000 3rd Qu.:3.000 3rd Qu.: 9.000 3rd Qu.: 7.000
## Max. :6.000 Max. :4.000 Max. :40.000 Max. :18.000
## Años_ultima_promoción Años_acargo_con_mismo_jefe
## Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.000 1st Qu.: 2.000
## Median : 1.000 Median : 3.000
## Mean : 2.188 Mean : 4.123
## 3rd Qu.: 3.000 3rd Qu.: 7.000
## Max. :15.000 Max. :17.000
## tibble [1,470 × 24] (S3: tbl_df/tbl/data.frame)
## $ Rotación : chr [1:1470] "Si" "No" "Si" "No" ...
## $ Edad : num [1:1470] 41 49 37 33 27 32 59 30 38 36 ...
## $ Viaje de Negocios : chr [1:1470] "Raramente" "Frecuentemente" "Raramente" "Frecuentemente" ...
## $ Departamento : chr [1:1470] "Ventas" "IyD" "IyD" "IyD" ...
## $ Distancia_Casa : num [1:1470] 1 8 2 3 2 2 3 24 23 27 ...
## $ Educación : num [1:1470] 2 1 2 4 1 2 3 1 3 3 ...
## $ Campo_Educación : chr [1:1470] "Ciencias" "Ciencias" "Otra" "Ciencias" ...
## $ Satisfacción_Ambiental : num [1:1470] 2 3 4 4 1 4 3 4 4 3 ...
## $ Genero : chr [1:1470] "F" "M" "M" "F" ...
## $ Cargo : chr [1:1470] "Ejecutivo_Ventas" "Investigador_Cientifico" "Tecnico_Laboratorio" "Investigador_Cientifico" ...
## $ Satisfación_Laboral : num [1:1470] 4 2 3 3 2 4 1 3 3 3 ...
## $ Estado_Civil : chr [1:1470] "Soltero" "Casado" "Soltero" "Casado" ...
## $ Ingreso_Mensual : num [1:1470] 5993 5130 2090 2909 3468 ...
## $ Trabajos_Anteriores : num [1:1470] 8 1 6 1 9 0 4 1 0 6 ...
## $ Horas_Extra : chr [1:1470] "Si" "No" "Si" "Si" ...
## $ Porcentaje_aumento_salarial: num [1:1470] 11 23 15 11 12 13 20 22 21 13 ...
## $ Rendimiento_Laboral : num [1:1470] 3 4 3 3 3 3 4 4 4 3 ...
## $ Años_Experiencia : num [1:1470] 8 10 7 8 6 8 12 1 10 17 ...
## $ Capacitaciones : num [1:1470] 0 3 3 3 3 2 3 2 2 3 ...
## $ Equilibrio_Trabajo_Vida : num [1:1470] 1 3 3 3 3 2 2 3 3 2 ...
## $ Antigüedad : num [1:1470] 6 10 0 8 2 7 1 1 9 7 ...
## $ Antigüedad_Cargo : num [1:1470] 4 7 0 7 2 7 0 0 7 7 ...
## $ Años_ultima_promoción : num [1:1470] 0 1 0 3 2 3 0 0 1 7 ...
## $ Años_acargo_con_mismo_jefe : num [1:1470] 5 7 0 0 2 6 0 0 8 7 ...
## Edad Ingreso_Mensual Antigüedad_Cargo
## Min. :18.00 Min. : 1009 Min. : 0.000
## 1st Qu.:30.00 1st Qu.: 2911 1st Qu.: 2.000
## Median :36.00 Median : 4919 Median : 3.000
## Mean :36.92 Mean : 6503 Mean : 4.229
## 3rd Qu.:43.00 3rd Qu.: 8379 3rd Qu.: 7.000
## Max. :60.00 Max. :19999 Max. :18.000
Teniendo en cuenta la información que contiene el dataframe, se seleccionan las siguientes variables
Variables categóricas:
Variables cuantitativas:
## tibble [1,470 × 6] (S3: tbl_df/tbl/data.frame)
## $ Viaje de Negocios: chr [1:1470] "Raramente" "Frecuentemente" "Raramente" "Frecuentemente" ...
## $ Departamento : chr [1:1470] "Ventas" "IyD" "IyD" "IyD" ...
## $ Horas_Extra : chr [1:1470] "Si" "No" "Si" "Si" ...
## $ Edad : num [1:1470] 41 49 37 33 27 32 59 30 38 36 ...
## $ Ingreso_Mensual : num [1:1470] 5993 5130 2090 2909 3468 ...
## $ Antigüedad_Cargo : num [1:1470] 4 7 0 7 2 7 0 0 7 7 ...
## Viaje de Negocios Departamento Horas_Extra Edad
## Length:1470 Length:1470 Length:1470 Min. :18.00
## Class :character Class :character Class :character 1st Qu.:30.00
## Mode :character Mode :character Mode :character Median :36.00
## Mean :36.92
## 3rd Qu.:43.00
## Max. :60.00
## Ingreso_Mensual Antigüedad_Cargo
## Min. : 1009 Min. : 0.000
## 1st Qu.: 2911 1st Qu.: 2.000
## Median : 4919 Median : 3.000
## Mean : 6503 Mean : 4.229
## 3rd Qu.: 8379 3rd Qu.: 7.000
## Max. :19999 Max. :18.000
## # A tibble: 6 × 6
## `Viaje de Negocios` Departamento Horas_Extra Edad Ingreso_Mensual
## <chr> <chr> <chr> <dbl> <dbl>
## 1 Raramente Ventas Si 41 5993
## 2 Frecuentemente IyD No 49 5130
## 3 Raramente IyD Si 37 2090
## 4 Frecuentemente IyD Si 33 2909
## 5 Raramente IyD No 27 3468
## 6 Frecuentemente IyD No 32 3068
## # ℹ 1 more variable: Antigüedad_Cargo <dbl>
## Clase de las variables seleccionadas:
## Viaje de Negocios Departamento Horas_Extra Edad
## "character" "character" "character" "numeric"
## Ingreso_Mensual Antigüedad_Cargo
## "numeric" "numeric"
## Edad Ingreso_Mensual Antigüedad_Cargo
## Edad 1.0000000 0.4977532 0.2128421
## Ingreso_Mensual 0.4977532 1.0000000 0.3638177
## Antigüedad_Cargo 0.2128421 0.3638177 1.0000000
Hipótesis:
Viaje de Negocios: Se espera que exista una relación entre la frecuencia de los viajes de negocios y la rotación de empleados. La hipótesis es que los empleados que viajan frecuentemente por negocios tienen una mayor probabilidad de rotar que aquellos que viajan raramente.
Departamento: Se espera que exista una relación entre el departamento en el que trabaja un empleado y su rotación. La hipótesis es que ciertos departamentos pueden tener tasas de rotación más altas que otros debido a diferencias en la cultura organizacional, la carga de trabajo o las oportunidades de crecimiento.
Horas Extra: Se espera que exista una relación entre trabajar horas extra y la rotación de empleados. La hipótesis es que los empleados que trabajan horas extra tienen una mayor probabilidad de rotar que aquellos que no lo hacen.
Edad: Se espera que exista una relación entre la edad de los empleados y su rotación. La hipótesis es que los empleados más jóvenes pueden tener una mayor probabilidad de rotar debido a la búsqueda de oportunidades de crecimiento, mientras que los empleados mayores pueden tener una menor probabilidad de rotar debido a la estabilidad laboral y personal.
Ingreso Mensual: Se espera que exista una relación entre el nivel de ingresos de los empleados y su rotación. La hipótesis es que los empleados con salarios más bajos pueden tener una mayor probabilidad de rotar en busca de oportunidades de mejor remuneración, mientras que aquellos con salarios más altos pueden tener una menor probabilidad de rotar debido a la estabilidad financiera.
Antigüedad en el Cargo: Se espera que exista una relación entre la antigüedad en el cargo de los empleados y su rotación. La hipótesis es que los empleados con menos antigüedad en el cargo pueden tener una mayor probabilidad de rotar en busca de mejores oportunidades de carrera, mientras que aquellos con más antigüedad pueden tener una menor probabilidad de rotar debido a la estabilidad laboral y las oportunidades de promoción.
## Tabla de estadísticas descriptivas para variables cuantitativas:
| Variable | Mínimo | X1er.Cuartil | Mediana | Media | X3er.Cuartil | Máximo |
|---|---|---|---|---|---|---|
| Edad | 18 | 30 | 36 | 36.924490 | 43 | 60 |
| Ingreso Mensual | 1009 | 2911 | 4919 | 6502.931293 | 8379 | 19999 |
| Antigüedad en el Cargo | 0 | 2 | 3 | 4.229252 | 7 | 18 |
##
## Tabla de frecuencia de las categorías para variables cualitativas:
| Variable | Frecuencia |
|---|---|
| Viaje de Negocios | 3 |
| Departamento | 3 |
| Horas Extra | 2 |
##
## Call:
## glm(formula = Rotación ~ `Viaje de Negocios`, family = "binomial",
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.1034 0.1389 -7.943 1.98e-15 ***
## `Viaje de Negocios`No_Viaja -1.3389 0.3315 -4.039 5.36e-05 ***
## `Viaje de Negocios`Raramente -0.6346 0.1638 -3.873 0.000107 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1274.8 on 1467 degrees of freedom
## AIC: 1280.8
##
## Number of Fisher Scoring iterations: 5
##
## Call:
## glm(formula = Rotación ~ Departamento, family = "binomial",
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.82866 0.09342 -19.576 < 2e-16 ***
## DepartamentoRH 0.38175 0.33417 1.142 0.25330
## DepartamentoVentas 0.48116 0.14974 3.213 0.00131 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1288.1 on 1467 degrees of freedom
## AIC: 1294.1
##
## Number of Fisher Scoring iterations: 4
##
## Call:
## glm(formula = Rotación ~ Horas_Extra, family = "binomial", data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.1496 0.1007 -21.338 <2e-16 ***
## Horas_ExtraSi 1.3274 0.1466 9.056 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1217.2 on 1468 degrees of freedom
## AIC: 1221.2
##
## Number of Fisher Scoring iterations: 4
##
## Call:
## glm(formula = Rotación ~ Edad, family = "binomial", data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.20637 0.30597 0.674 0.5
## Edad -0.05225 0.00870 -6.006 1.9e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1259.1 on 1468 degrees of freedom
## AIC: 1263.1
##
## Number of Fisher Scoring iterations: 4
##
## Call:
## glm(formula = Rotación ~ Ingreso_Mensual, family = "binomial",
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -9.291e-01 1.292e-01 -7.191 6.43e-13 ***
## Ingreso_Mensual -1.271e-04 2.162e-05 -5.879 4.12e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1253.1 on 1468 degrees of freedom
## AIC: 1257.1
##
## Number of Fisher Scoring iterations: 5
##
## Call:
## glm(formula = Rotación ~ Antigüedad_Cargo, family = "binomial",
## data = rotacion)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.11841 0.10380 -10.775 < 2e-16 ***
## Antigüedad_Cargo -0.14628 0.02424 -6.033 1.61e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 1298.6 on 1469 degrees of freedom
## Residual deviance: 1255.9 on 1468 degrees of freedom
## AIC: 1259.9
##
## Number of Fisher Scoring iterations: 5
| Variables | Odds_Ratios | |
|---|---|---|
| Horas_ExtraSi | Horas_ExtraSi | 4.1551317 |
| DepartamentoVentas | DepartamentoVentas | 1.9145694 |
| DepartamentoRH | DepartamentoRH | 1.5471128 |
| (Intercept) | (Intercept) | 1.1758364 |
| Ingreso_Mensual | Ingreso_Mensual | 0.9999181 |
| Edad | Edad | 0.9683310 |
| Antigüedad_Cargo | Antigüedad_Cargo | 0.8942634 |
Viaje de NegociosRaramente |
Viaje de NegociosRaramente |
0.5067194 |
Viaje de NegociosNo_Viaja |
Viaje de NegociosNo_Viaja |
0.2581596 |
| Variables | Coeficientes | Significancia | |
|---|---|---|---|
| (Intercept) | (Intercept) | 0.1619797 | |
Viaje de NegociosNo_Viaja |
Viaje de NegociosNo_Viaja |
-1.3541771 | * |
Viaje de NegociosRaramente |
Viaje de NegociosRaramente |
-0.6797980 | * |
| DepartamentoRH | DepartamentoRH | 0.4363905 | |
| DepartamentoVentas | DepartamentoVentas | 0.6494927 | * |
| Horas_ExtraSi | Horas_ExtraSi | 1.4243441 | * |
| Edad | Edad | -0.0321813 | * |
| Ingreso_Mensual | Ingreso_Mensual | -0.0000819 | * |
| Antigüedad_Cargo | Antigüedad_Cargo | -0.1117549 | * |
A continuación se procede con la interpretación de los coeficientes:
1.Intercept: Este es el intercepto del modelo. Representa el logaritmo de la razón de probabilidades de rotación cuando todas las variables predictoras son cero. En este caso, es 0.1619797, lo que significa que cuando todas las demás variables son cero, el log-odds de rotación es de aproximadamente 0.16.
Viaje de NegociosNo_Viaja: Un coeficiente negativo (-1.3541771) indica que los empleados que no viajan por negocios tienen menores log-odds de rotación en comparación con aquellos que viajan por negocios, manteniendo todas las demás variables constantes.
Viaje de NegociosRaramente: Un coeficiente negativo (-0.6797980) indica que los empleados que viajan raramente por negocios tienen menores log-odds de rotación en comparación con aquellos que viajan frecuentemente por negocios, manteniendo todas las demás variables constantes.
DepartamentoRH y DepartamentoVentas: Los coeficientes positivos (0.4363905 y 0.6494927 respectivamente) indican que pertenecer al departamento de Recursos Humanos o al departamento de Ventas está asociado con mayores log-odds de rotación, en comparación con el departamento de referencia (probablemente otro departamento no mencionado).
Horas_ExtraSi: Un coeficiente positivo (1.4243441) indica que trabajar horas extra está asociado con mayores log-odds de rotación.
Edad y Antigüedad_Cargo: Los coeficientes negativos (-0.0321813 y -0.1117549 respectivamente) indican que el aumento en la edad y en la antigüedad en el cargo están asociados con menores log-odds de rotación.
Ingreso_Mensual: Un coeficiente negativo (-0.0000819) indica que un aumento en el ingreso mensual está asociado con menores log-odds de rotación, aunque el efecto es muy pequeño y casi despreciable.
## El área bajo la curva (AUC) es: 0.7654207
Si deseas consultar como fue construido y desarrollado mi informe, ingresa al siguiente enlace: Repositorio Github